查看原文
其他

我们这十年!


年前,出去见客户,总会遭遇连环追问,“云是什么?”“我为什么上云?”“腾讯还做云?

 

十年后,“没必要再多讲了,只有All In产业互联网这一条路!”

 


一、“意外”长出一朵云

 


一个看起来有些意外的“边缘起点”,却一路成长为腾讯To B十年的坚实底座。


时间回到2008年,一家叫做“五分钟”的公司制作了一款名为“开心农场”的游戏,掀起了全民“偷菜”热潮。


开心农场在各大平台上线后,用户很快破亿,日活跃玩家数千万。当时几乎家家户户都定好闹钟,凌晨两三点爬起来“收菜”,乐此不疲。


但农场背后却并不“岁月静好”,经常一遇到高并发的情况,服务器就挂了,留下一群玩家疯狂吐槽。


这样的情况在2010年迎来了转机。


腾讯正式宣布开放战略,下定决心把自身的技术和产品全面对外开放。


在当时的QQ空间开放平台上,游戏开发者、应用开发者从试探到蜂拥而至,很快,腾讯的平台角色被更多开发者认可和需要,社交、QQ支付、广告等能力也在越来越多的应用生态中生根发芽。

 



早期QQ界面


社交游戏的风靡,服务器的需求也应声飞涨。仅为了支持偷菜一款产品,在短短一个月内,我们就额外采购和上架了几千台服务器,并在技术架构上做了很多当时看非常前沿的探索。


只不过对当时的我们来说,什么是“云”,还只是一个模糊的概念。


但有一点很明确,“流量到来前,如何设计一个高可用的IT架构”、“流量激增时,如何快速补充服务器资源”、“流量下降后,如何不浪费闲置服务器资源”是业界普遍为之叫苦不迭的难题。而这正是腾讯的强项——多年服务海量用户的经验让腾讯有了独具优势的技术能力。


从客户的需要出发,通过“云服务”的雏形,腾讯将这种技术能力开放了出来。


加速键随即按动……

2010年第三季度,云平台部成立,只有十多个人。当时爆红的《保卫家园》、《胡莱三国》等游戏上线时,已有团队驻场解决一些大流量、高并发的问题。


到年底,腾讯开放平台上3000家客户

 

对于云的未来,我们有迷茫,也有想象。



二、走出腾讯生态圈,做一朵真正的公有云

 


2012年,开放云初期,在广东汕头的一个数据中心里,老旧的机房设施很是让人头疼。“一到刮台风的时候,就得往数据中心运柴油,用电机保证机房不断电。


硬件的困难还能够靠人力腾挪资源强行克服,软件问题则是牵一发而动全身。


云计算的基础逻辑是,将物理服务器虚拟化后产出云服务器,用户则从虚拟资源池中按需购买算力。


当时业界最主流的虚拟化技术是剑桥大学开发的Xen。不管对于腾讯云还是其他云服务商来说,Xen都是计算虚拟化的不二之选。


但Xen虽然受欢迎,却也有它的“致命问题”,代码过于复杂,当规模达到一定程度后,出问题的几率几乎是成倍增长,且难以把控。


“简直像闹鬼,出了问题排查很久都找不到原因!”


此时,行业的大环境也在悄然发生变化。海外,AWS公有云的模式已经得到验证;国内,移动互联网大潮正在到来,一批互联网创业公司开始冒尖,云服务的需求已经在爆发前夜。


有一件事在无形中成为了大家的共识:腾讯的技术必须要走出腾讯的生态圈,为更大范围的企业提供服务——这要求底层技术足够稳定。


腾讯云的工程师们将希望寄托在了来自开源社区的KVM上。经过充分的调研和验证,这项技术代码简单清晰,没有Xen复杂的历史包袱,但版本还相对初级,并未经过业界的商业化验证。


2013年初,技术团队闭关了两个月的时间,研发出了基于KVM的热升级技术,还赢来了一个可以实战演练的机会——用开放云上5%的机器试。




KVM早期技术团队合影

 

KVM路径被证明可行。同时,计算团队开始自研云计算操作管理系统VStation,更加高效地创建和管理云服务器集群。


2013年上半年,我们完成了底层重构,KVM虚拟化技术+云计算操作管理系统VStation为接下来云业务的高速发展打下了坚实地基。


两年后,当其他云服务商感受到 Xen 的局限,开始将虚拟化技术从Xen艰难搬迁到 KVM时,我们已经在KVM技术栈上深耕两年,并成为了开源社区的贡献大户。


2013年,开放云正式更名为QCloud,开始面向开放平台之外的更多外部客户,也有了新目标——要做一朵真正的公有云


 

三、我说一下对腾讯云的态度:往死里帮!


2014年冬天,打车补贴之战一触即发。


为了抢占市场,大量补贴像雪花般投放给用户,订单量从十万快速增加到百万级别,每到早晚高峰,系统和程序员们不堪重负。

 

客户愁眉不展时,腾讯连夜调集了一支“精锐部队”前去支援。

 

正月的北京乍暖还寒,技术专家赶到北京时,团队已连续“救火”多天。两边技术团队盘算了一下,随即做了这样几件事:


与客户一起在打车业务逻辑中增加了几个关键的柔性降级开关,比如说超过警戒容量之后的订单丢弃和安抚通知;用腾讯自身的框架和协议重写了PushServer和LBS定位系统,解决了接入上限的问题。

  

因机房条件艰苦,中间同机房其他公司的产品发生疑似攻击的情况,把带宽打满了,一点小小的流量就可能将整个系统弄垮。于是,双方联合团队做出了一个决定——将整个系统平迁到腾讯内部机房。

 

七天七夜,成功渡过险境。

 

我们的技术能力与业界口碑也因此逐渐立起来了。


在这个过程里,一直有一位战友坚定的站在身旁。


他就是TEG,腾讯技术工程事业群。


这个腾讯最神秘的事业群,几乎很少为外界所知,却以其专注技术的定位吸引了许多顶尖的技术高手汇聚一堂。


2014年-2016年,云的规模还不算大,TEG的架构平台部已经开始定点支持腾讯云,服务云上客户的技术需求。


有一次,在终于拿下了一个重要的CDN客户后,有位程序员小哥兴冲冲的买了120斤西瓜送到了TEG当时所在的深圳朗科大厦。


几个身着文化衫的男子,肩扛西瓜,手拎菜刀,一股脑儿的冲进写字楼,并且服务到位的切成一排,招呼兄弟团队的大伙儿来吃。多年后,这个故事还被当时的亲历者和后来的听说者津津乐道。



腾讯云同事给TEG同事送西瓜


在To B真正被官宣成为集团的核心战略业务之前,不同团队的想法实际上千差万别。


一些声音最后到了TEG总裁Ls的耳朵里,他在内部大会上专门强调:“我说一下对腾讯云的态度:往死里帮!”各种争议和讨论自此消失。


在采访中,Dowson也特别感慨的说:“说实话,如果没有TEG和卢总的大力支持,非常给力的支持,我们不可能走到今天。”


可以说,腾讯To B这一路,TEG都没错过,是陪伴者,更是亲历者。


 

四、保持亮剑精神,打赢一场现代化战争!

 

2014年上半年,云上的业务量开始起来了。


但运作的形式还像是创业公司,初期团队很小,没有架构师,前端销售人也很少,谈客户时甚至常常出现商务不够、产品来凑的情况,找集团借专家工程师坐镇的事情也屡见不鲜。


这没有让云停下成长的脚步。


从2014年开始,陆续和富途证券、泰康保险达成了合作。但这些合作仍然是保险证券公司比较表层的互联网业务,不涉及核心系统的改动。


2014年9月,TEG的同事带过来一个振奋人心的好消息:腾讯投资的一家银行,刚刚拿到了牌照,经过内部讨论,决定整个银行的系统都使用云和分布式架构!


这家银行,就是今天的微众银行。


Coby火速向团队传达了Pony的态度:不惜一切代价支持微众银行。


根据开发时间表,微众银行的分布式核心架构最晚在12月底就要上线。当时已经9月,中间还有一个“漫长”的国庆节假期。


最关键的是,一个银行级别的私有云到底应该长啥样,没人清楚。


“这种难度相当于一个只做过民用汽车的工厂来做一辆坦克。”一是要把腾讯公有云的技术变成银行内部使用的私有云;二是要把一个互联网基因的云改造成符合国家监管的、适合金融行业的云。

 



金融云团队早期项目讨论会


由于监管要求,银行必须使用完全属于自己的数据中心,因此,腾讯必须把腾讯云从自己体内拆出来,装进微众银行的机房。


“这有点像一台心脏移植手术。”


幸好,有十几年的腾讯增值业务、计费业务、Q币之类的实战磨练,腾讯的数据库 TDSQL 已经足够坚强,只要加以改造就能满足金融级别的要求。这最终帮助我们赢下了这场和时间的赛跑。


12月20日,在微众银行的机房里,银行级别的私有云这部巨大的引擎,终于顺利地跑起来了。随即,微众银行开始了接力,在这套全新的分布式云架构上马不停蹄地部署银行软件系统。


2015年5月,微众银行的第一款服务“微粒贷”正式开门迎客。从第一个客户开始,微众银行就跑在了完全分布式架构的腾讯云上。


坦白说,那个时候的打法有点像游击队,靠着一定会胜利的亮剑精神,用坚强的意志力和卓越的组织力去克服局部的困难,但是这种方式不可能永远有效,甚至可能打不赢一场现代化的战争。


因此,故事的后来,我们开始了自我进化——FT(feature team)制度改革到来了,用包产到户的形式,进行更加明确的行业梳理,建立更加完善的流程机制。


大家带着初生般的热情,冒着劲儿地往前冲。


 

五、如果你相信基因,就应该相信进化。

 

2017年,Pony带回来一个消息,数字广东要组建“敢死队”。


“深入敌后、孤军作战、没有后援。”这是腾讯云政务团队刚成立时面临的真实情况。只有6个人,“在这种情况下我们要打仗,而且要打胜仗。”


为广东省政府搭建一套数字化体系,政府之前做这个项目的至少有上千人,而我们最开始只有二十多个人。每天的加班加点不在话下,深夜两三点回到家、第二天一早又准点出现也是家常便饭。


还记得数字广东项目攻坚的重要关头,有一天,因为已经太久没看到自己的丈夫,一位同学的家属终于找到了办公室,重重地把一纸离婚协议书拍在了桌子上……


就这么一年多硬抗下来,在团队全力投入下,终于助力广东省建成了“数字政府”,广东的全国省级政府网上能力从2016年的全国第九提升到了2018年的全国第一。


数字广东可以说是腾讯政务云乃至广东省数字改革的“一号工程”。它改变了过去传统政务信息化的模式,广东省所有省直属部门信息中心的成建制得以转变,政府做管理的事,数字广东公司进行信息化建设和运营,创新性的实现了管运分离。


如果你相信基因,就应该相信进化。


回想当时,团队的攻坚微信群名不约而同的选择了“血战温泉关”、“突破天险腊子口”、“骑兵连进攻”、“野狼团”这样战斗的口号,作为亲历者,这些名字更像是走夜路唱歌——给自己壮胆。


初期刚来到To B的战场,确实不太好过,被吐槽、被当面质疑也都经历过。对我们来说,其实不怕客户抱怨,有问题改就是了。最怕的是,感觉不太好,但却不知道如何改进。


所幸,数字广东项目的成功落地,为腾讯云在政务行业立下了毋庸置疑的好口碑。没有人再说,腾讯没有To B基因了。


云的发展切入了下一个时代的大机会,也是一张未来的入场券。在更多行业,我们开始了和客户一起的“野蛮成长”。


2018年,智慧零售战略合作部在腾讯成立。其中一个客户是永辉。


永辉的老板总会开玩笑的说自己是卖菜的,卖了20多年菜。但这反而是最宝贵的经验。“在他们面前,我们确实不懂零售,但我们愿意学习,一起优势互补。”





这两年,零售团队和很多零售行业的从业者有了更深的接触,“跟他们接触的越深,真心觉得做生意不容易,就越希望通过自己的技术能力,帮他们把生意做好。”


 

六、我们都到了一个战壕!

  


2018年,腾讯高层管理者破天荒的开了整整三天的闭门会。会议上,所有人上交手机,围着桌子坐成一个圆圈,每人半小时发言,阐述自己的业务构想。会议的最后,总办决定进行腾讯历史上第三次组织架构变革。


几天前,当Dowson走出滨海大厦顶楼的办公室的时候决心已定:“没必要再多讲了,只有ALL IN产业互联网这一条路!”


2018年9月30日,这次变革正式对外公布。


“930变革”的重要内容之一正是成立云与智慧产业事业群(CSIG)。这是腾讯成立20年历史上,第一次出现完全面向B端的大业务单元。


至此,原本星罗棋布、分散在各个事业群下面的To B业务获得了统一的接口,以更加聚合、更加高效的方式拧了成一股绳,为企业客户提供更优质的服务。


大家终于成为了一个战壕的兄弟!


2019年,腾讯云全球市场份额超过了IBM,在全球云厂商里排名第五。几大国际云厂商里,腾讯云连续多年增速最快


到目前,我们已经服务了国内最多的主流电商平台、超过70%的游戏公司、在视频行业的渗透率超过90%。此外,在政务、金融、工业等领域,我们都是云服务的重要提供商。


Coby说,腾讯对云的理解,也经历了从基础设施虚拟化能力、企业IT设施重构到数字化助手的进化。现在,云服务如同熟悉的消费互联网,越来越容易被获取,就像随时随地打开的APP,可以灵活组装,像菜单式的工具箱。


 

七、生在云上、长在云上

今年,一场突如其来的疫情改变了一切。


产业互联网却也因此成为了人们生活中不可或缺的部分。


2020年2月7日,“武汉战疫”小程序刚刚上线的那天早上,有位加班多天的同事女儿突然发烧了。他的第一反应是:“完了,我把我女儿害了”。


从大年初四接到武汉市政数局(政务服务和大数据管理局)电话那天起,团队几乎天天都要出门开会,和政府沟通开发需求,整合腾讯的医疗资源和健康服务做在线问诊、知识问答的小程序,帮助解决问题。




健康码项目协作

 

尽管大家尽量不出门,在家通过线上的方式沟通工作。但和政府沟通的需求非常多,还是不得不出门开会。不得已就自己睡一间房,和家人隔离开,基本都是凌晨三四点才回家、早上八九点又出门,家人见不到几面。


好在,同事的女儿发烧最后是虚惊一场——家里暖气有点热,她流了很多汗,擦掉汗再量一次,体温就正常了。


疫情期间,CSIG的许多人、许多团队都在熬夜加班,与合作伙伴一起,支持了全国100多个城市的疫情防控小程序的部署上线。通过小程序上的健康码和其他服务的触达,实实在在的助力政府提升了疫情防控的效率。


2月3日,星期一,农历正月初十,春节后第一个开工的早晨。刚到8点,几乎所有的远程办公软件都崩了。


在深圳的腾讯会议“特别作战室”中,很快聚集起整个公司的支援同学,其中包括CSIG和TEG有着海量服务经验的T4专家。在一群人不眠不休的努力之下,短短8天时间里,腾讯会议快速扩容了100万核服务器,创造了行业新的历史。


此后,不管行业其他软件怎么“抖动”,腾讯会议再也没有崩过。


很快,新的历史又被创造了出来——上线了245天的腾讯会议用户数超过了1亿,成为最快超过1亿用户的视频会议产品。


在一次内部分享中,腾讯会议的负责人Lori感慨:“腾讯会议生在云上、长在云上,才有今天的快速发展。”


跌跌撞撞走了十年,路越走越宽,我们也走得越来越坚定,无论是客户还是我们自己,都不会再问,什么是云?因为:


“我们做的就是云!”


🔚



这里还有

 腾讯的敏捷研发之战


● 鹅厂工程师做了个AI“扫雷攻略”,免费加buff



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存